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The design and implementation of systems OCR Amazigh character is very 
crucial for the promotion and development of the Amazigh language. To date, 
there is the lack of this type of system. Therefore, the automatic character 
recognition and text Amazigh has experienced in recent years a very significant 
interest in research work. Indeed, some systems have been developed to 
improve this situation. In this paper, we describe the different systems and 
approaches that were developed and tested in our laboratory to automatically 
recognize the Amazigh writing, showing the characteristics and results of each. 
This description will allow us to conduct a comprehensive summary of the 
various approaches and proposed systems that will help us to launch the 
outlook for future work. 


1. Introduction 

Dans le domaine de la reconnaissance automatique des caracteres, plusieurs 
recherches scientifiques ont ete effectuees sur le caractere latin, arabe, et autre. 
Ceci a permis le developpement de plusieurs approches de reconnaissance 
automatique de ces caracteres et, par consequent, des lecteurs optiques pour 
scanner et reconnaitre automatiquement les documents correspondants. Par contre, 
le caractere amazighe, appele tifinaghe, est tres peu traite. Des approches ont ete 
proposees pour la reconnaissance de ce caractere. Ces approches sont regroupees 
generalement en grandes classes telles que les approches statistiques (Oulamara, 
1988), (Djematen et cil., 1997), les approches basees sur les reseaux de neurones 
(Ait Ouguengay, 2008), (El Yachi et al., 2009), (Bouikhalene et al., 2009) (Es 
Saady et al., 2011), l’approche syntaxique (Es-Saady et al., 2010), les Modeles de 
Markov caches (Amrouch et al., 2010), (Amrouch et al., 2012) et l’approche basee 
sur la programmation dynamique (El Yachi et al., 2010). Dans cet article, on 
s’interesse a presenter un etat des lieux et une synthese presentative et comparative 
des travaux de recherche scientifique effectues et publies dans le domaine de la 
reconnaissance automatique de caracteres amazighes imprimes et manuscrits, soit 
au niveau de notre laboratoire soit ailleurs. 

Nous presentons en premiere partie les principales bases de donnees de caracteres 
amazighes developpees pour pouvoir tester et valider des approches. La seconde 


119 



Ali Rachidi 


partie est consacree a la description des differents travaux effectues dans le 
domaine de la reconnaissance automatique de l’ecriture amazighe. Nous presentons 
dans la troisieme partie nos contributions dans ce domaine. Enfin, nous donnons 
une synthese detaillee et comparative de ces systemes tout en precisant les 
avantages et les limites de chaque systeme et en lanqant un certain nombre de 
perspectives a developper dans les travaux futurs.. 

2. Principales bases de caracteres amazighs developpees 

Pour pouvoir experimenter et valider les differentes approches et systemes 
developpes, il est primordial de creer des bases de caracteres amazighes. Des bases 
de donnees d’images de caracteres amazighes annotees sont inexistantes. Ce 
domaine souffre ainsi 1’ absence d’une base de donnees de reference qui permet des 
comparaisons objectives entre les differents systemes de reconnaissance. Tous les 
travaux publies dans ce domaine ont ete experimentes sur des bases de donnees 
locales, qui contiennent un nombre restreint de 1’ alphabet amazighe. 

Dans les deux sous-sections suivantes, nous decrivons les deux bases de caracteres 
existantes. 

2.1. Base des patterns de la graphie amazighe 

C’est une base de patterns de differentes fontes amazighes et de tailles variees 
proposee par Ait Ouguengay (2009). Elle contient au total 12 polices de caracteres 
et les tailles de 10 points a 28 points pour chaque modele. Les patterns sont fournis 
sous forme d’images bitonales de tailles variables. La taille maximale est de 
102x129 pixels, tandis que la taille minimale est de 19x2 pixels. Une telle disparite 
s’explique par le fait que le caractere ya (a) est un petit cercle, et est done beaucoup 
plus petit que les autres caracteres. Outre le cas particulier du caractere ya (a), la 
base est constitute des patterns de differentes fontes amazighes et de tailles variees 
qui ne sont pas normalisees. Le Tableau 1 donne une liste de quelques patterns 
dans cette base. 
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Tableau 1 : Exemples de quelques caracteres dans la base des patterns de la 

graphie amazighe 

Dans cette base, la maniere dont sont creees les images des patterns ne permet pas 
la possibilite de renormaliser leur taille en une taille moyenne fixe. En effet, ceci 
peut etre genant en particulier a cause de la ressemblance des caracteres ya (a) et 
yar (r) qui ne se differencient que par la taille : le caractere ya (a) est un petit cercle, 
tandis que le caractere yar (r) est un grand cercle. Dans certains cas, on aura une 
confusion reelle entre des images de ces deux classes. 

2.2. Base de caracteres manuscrits 

C’est une base de donnees de caracteres amazighes manuscrits (A Database for 
Amazigh Handwritten Character Recognition Research : AMHCD) que nous avons 
creee et developpee au sien de notre Laboratoire IRF-SIC de l'Universite 
Ibn Zohr d’ Agadir. La base contient 25740 images de caracteres amazighes 
manuscrits isoles et etiquetes, produites par 60 scripteurs de sexe, d’age et de 
fonction differents. Le lecteur peut trouver une description complete et detaillee 
sur cette base dans (Es Saady et al. , 201 1). 

Jusqu'a present, la base AMHCD est peu utilisee et exploree pour 1’ evaluation des 
systemes de reconnaissance de l’ecriture amazigheD. ( 2010 ( Amrouch et al., 2010) 
(Amrouch et al., 2012a) (Amrouch et al., 2012b). En revanche, elle s’ est imposee 
comme la seule et la premiere base dans sa categorie (graphie manuscrite 
amazighe), grace a sa taille importante et a sa disponibilite pour les recherches 
academiques. 

Le Tableau 2 presente des exemples des caracteres amazighes manuscrits. Chaque 
caractere est donne sous forme de deux variantes qui correspondent aux deux 
scripteurs differents. 
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Tableau 2 : Exemples de caracteres amazighs manuscrits issus de la base 
AMHCD (Essaady el al., 2011) 


3. Approches de reconnaissance automatique existantes 

En comparant au latin, a l'arabe ou au chinois, les recherches sur la reconnaissance 
automatique d'ecriture amazighe n'ont pas atteint la perfection. Autant que nous le 
sachions, peu de tentatives ont ete menees sur la reconnaissance d'ecriture 
amazighe. Dans cette section, nous citons des travaux publies qui traitent la 
reconnaissance de l’ecriture amazighe. 

Parmi les anciennes etudes qui portent sur la reconnaissance de caracteres tifinaghs, 
on cite, en premier lieu, les travaux d’Oulamara J. (1988). La methode proposee 
dans cette reference est une methode statistique basee sur 1’ extraction de segments 
de droite par la transformee de Hough. L'analyse du caractere dans l'espace 
parametrique, obtenu par la transformation de Hough, permet d'extraire les 
caracteristiques specifiques en association avec un modele de reference generateur 
de 1' ensemble des caracteres de l'alphabet. Un codage original est deduit puis utilise 
comme base de construction de la matrice de lecture representant une forme codee 
de l’alphabet. L’auteur a obtenu des resultats qui semblent interessants J. (1988) 
sur les caracteres amazighes imprimes d’une base de caractere locale. 

(Djematen et al, 1998) considerent que la methode publiee par (Oulamara et al., 
1988) n'est pas une technique appropriee pour les caracteres amazighes manuscrits 
puisqu'elle produit des segmentations incorrectes. Pour surmonter la difficulte des 
caracteres presentant des traits inclines, ces auteurs (Djematen et al, 1997, 1998) 
proposent une methode statistique de reconnaissance de caracteres berberes 
manuscrits basee sur la position des points caracteristiques dans le rectangle- 
enveloppe de 1’ image du caractere. Apres des pretraitements (normalisation 
bidirectionnelle, le lissage, 1’ extraction des composantes connexes) sur le caractere, 
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des primitives sont extraites sur chaque squelette, comme les extremites, les points, 
les sommets (points de changements de direction) et les nceuds a 3 et 4 branches. 
Enfin, la representation du caractere fournit une description sous forme de lettres 
utilisant un codage predefini. Cette description code les positions des points 
caracteristiques du caractere dans le rectangle-enveloppe. La reconnaissance 
consiste a mesurer le degre de ressemblance entre le code elabore et les codes de 
reference en utilisant la distance metrique. Les resultats obtenus sont plus ou moins 
encourageants sur une base de caracteres localement definie malgre quelques 
erreurs qui viennent du module de pretraitement. 

Ait Ouguengay (2009) a propose un reseau de neurones artificiels (RNA) pour la 
reconnaissance de caracteres amazighs. Le reseau de neurones utilise est un 
perceptron multicouche a une seule couche cachee. Ce dernier a ete entraine sur 
une base de donnees qui contient des patterns de la graphie amazighe de differentes 
fontes et tailles, cree localement. La simulation du reseau de neurones a ete realisee 
par le logiciel libre JavaNNS (java neural networks simulator). Les caracteristiques 
geometriques utilisees sont : les projections horizontales et verticales, les centres de 
gravite en x et en y, le perimetre, l’aire, la compacite et les moments centraux 
d'ordre 2. D’apres 1’ auteur, cette approche a donne de bons resultats sur 1’ ensemble 
des patterns d’entrainement. Cependant, les resultats de test sont encore loin d’etre 
satisfaisants a cause de la base de test qui est tres faible par rapport aux poids de 
RNA a determiner. 

Pour sa part, El Ayachi et al. (2010) propose un systeme de reconnaissance de 
l’ecriture tifinagh base sur les moments invariants et la transformee de Walsh 
utilisant la programmation dynamique. Le systeme propose contient trois parties 
principals : les pretraitements, l'extraction de caracteristiques et la reconnaissance. 
Dans le processus de pretraitement, l'image du document numerise est nettoyee 
puis elle est segmentee en caracteres isoles a l'aide des techniques de 
l’histogramme. Dans le processus d' extraction de caracteristiques, les moments 
invariants et les coefficients de Walsh sont calcules sur les caracteres segmentes. 
La programmation dynamique est adoptee dans l’etape de reconnaissance. Les tests 
ont ete faits sur plusieurs images d’ecriture amazighe. D’apres les auteurs, les 
resultats experimentaux montrent que la methode de la reconnaissance utilisant des 
moments invariants donne de meilleurs resultats par rapport a la methode fondee 
sur la transformee de Walsh en termes de taux de reconnaissance, de taux d'erreur 
et de temps de calcul. Plus recemment, les memes auteurs (2011) ont propose dans 
un reseau de neurones multicouches avec les memes caracteristiques utilisees 
precedemment. Les resultats trouves avec un reseau de neurones d’une seule 
couche cachee sont meilleurs que ceux obtenus avec la programmation dynamique. 
De plus, le taux de reconnaissance obtenu en utilisant une seule couche cachee est 
plus eleve que celui obtenu avec deux ou trois couches cachees. 

Dans la section suivante, nous presentons nos contributions en terme de conception 
et de developpement de nouvelles approches de reconnaissance automatique de 
caracteres amazighs imprimes ou manuscrits en les testant sur la base de caracteres 
volumineuse et riche (A Database for Amazigh Handwritten Character Recognition 
Research :AMHCD) (Es Saady et al., 201 1). 
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4. Nos systemes de reconnaissance automatique proposes 
4.1. Approches Markoviennes 

Dans (Amrouch et al., 2010, 2012a), nous avons propose une approche basee sur 
les modeles de Markov caches de type modele discriminant DM-HMM qui 
s’interesse aux problemes de caracteres isoles. Ce type de modelisation est 
largement utilise dans le domaine de la reconnaissance de la parole. Cette 
modelisation est aussi efficace pour reconnaitre une forme entachee d’ incertitude et 
d’ aspect de dynamisme comme le caractere amazigh. Un processus Markovien a 
mis en oeuvre des modeles probabilistes specifiques dans le but de gerer 
1’ incertitude et le manque d’ informations qui entachent les formes a reconnaitre. 
Apres des pretraitements sur 1’ image du caractere amazigh, le systeme fait recourt 
a des primitives directionnelles dans la generation des sequences d’ observations. 
Ces observations sont obtenues a l’aide de la technique des fenetres glissantes 
operant sur la transformee standard de Hough des images de caracteres. Les 
sequences d’ observations obtenues sont utilisees pour entrainer les modeles HMMs 
initiaux des caracteres lors de la phase d’apprentissage ; chaque modele utilise les 
echantillons de sa classe. Par la suite, nous avons utilise le classifieur Forword pour 
reconnaitre le caractere. En effet, cette approche consiste a associer un ou plusieurs 
modeles par classe. De ce fait, la reconnaissance s’effectue en estimant les 
probabilites d’ emission de la suite d’ observations O de la forme a reconnaitre par 
les differents modeles prealablement construits. La forme a reconnaitre est affectee 
a la classe dont le modele qui maximise la probability Cette approche est 
pratiquement utilisee dans le cas oil le nombre de classes a reconnaitre est 
relativement limite, c’est-a-dire au vocabulaire limite comme F alphabet amazigh. 
Toutefois, elle devient couteuse en temps de calcul et espace memoire quand ce 
nombre depasse le millier, puisque chaque classe possede au moins un modele qui 
lui est propre. 

Nous avons evalue les performances de notre systeme sur la base AMHCD des 
caracteres amazighes manuscrits isolees (Es Saady et al., 2011), avec deux 
variantes. La premiere adopte la modelisation discrete des probabilites 
d’ emission, quant a la seconde, elle utilise les HMMs continus. Le tableau 3 ci- 
dessous presente les differents taux de reconnaissance en utilisant le modele discret 
et continu selon le nombre d’etats de modele et de la taille de la base de caractere. 
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Topologie de modele 
utilisee 

HMMs Discrets 

HMMs Continus 

Taille de la 
base 

Taux de 
Recon 

Taille de 
la base 

Taux de 
Recon 

Modele a 14 etats 

2220 

caracteres 

90.04 % 

- 

- 

Modele mono et 2 
gaussiens a 6 etats 

- 

- 

25740 

caracteres 

96,21% 

Modele mono et 2 
gaussiens a 10 etats 

- 

- 

25740 

caracteres 

96 , 88% 

Modele mono et 2 
gaussiens a 14 etats 

- 

- 

25740 

caracteres 

97 , 89% 


Tableau 3 : Resultats de reconnaissance du systeme dans le cas discret et 

continu 


Nous estimons que les erreurs de la variante discrete proviennent essentiellement 
de: (1) la modelisation discrete utilisee, a ce niveau, on a recours au risque de la 
perte des informations ; (2) a la taille des donnees utilisees pour creer la base des 
modeles de reference. 

Pour valider cette hypothese et remedier a cette defaillance, nous avons augmente 
la taille des donnees utilisees et remplace les modelisations discretes par les 
HMMs continus. 

L’ augmentation de la taille des donnees d’apprentissage et la modelisation des 
densites des probability par les gaussiennes ont contribue a diminuer le taux 
d’erreur commis par notre systeme. Nous avons passe d’un taux d’erreur global de 
9,6% (premiere experience avec HMM discrets) a un taux de 2,1 1% c’est-a-dire un 
gain d’un facteur de 7,49%. De ce fait, les resultats obtenus dans le cas continu 
sont meilleurs que ceux obtenus dans le cas discret. 

Dans (Amrouch et al., 2012b, 2012c), nous avons propose un autre systeme pour la 
reconnaissance de caracteres Tifinaghs imprimes, base sur une nouvelle approche 
qui exploite les caracteristiques et les specificites morphologiques de la langue 
amazighe. La solution apportee adopte une modelisation markovienne de type 
chemin discriminant (DP-HMM), optimisee par des algorithmes fondes sur la 
programmation dynamique S.K. (1996 ; Casey, E. (1996). L’approche s’appuie 
sur la proposition d’une nouvelle liste des segments, qui se compose d’un ensemble 
de traits fondamentaux constituant les caracteres amazighs. Ceci permet de mieux 
exploiter la redondance de ces traits dans les traces des lettres amazighes. La 
description de la structure des caracteres repose sur ces elements. En effet, les 
caracteristiques exploitees sont extraites des traces des caracteres par une technique 
de localisation implicite des segments qui le composent. Pour ce faire, nous avons 
utilise les points d’interets des squelettes. Dans la phase de l’apprentissage, un seul 
modele HMM global construit et entralne sur les elements du vocabulaire propose 
par des primitives structurelles et geometriques. Chaque chemin au long de ce 
treillis represente une sequence de segments, qui constitue un caractere de 
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1’ alphabet tifinagh. La reconnaissance s’effectue en decodant dynamiquement le 
chemin optimal suivant le critere de maximum de vraisemblance. 

Pour valider le systeme propose, nous avons effectue des experimentations 
significatives sur la base de donnees de patterns de la graphie amazighe (Essaady et 
al., 2011). Plusieurs tests ont ete effectues pour evaluer le taux de reconnaissance 
du systeme en fonction du : nombre d’etats et du nornbre de melanges de 
gaussiennes. Le Tableau 4 ci-dessous presente les resultats obtenus de ces tests sur 
cette base. 


Nombre d’etats 

3 

5 

Nombre de gaussienne 

1-2-3 

1-2-3 

Taux de reconnaissance 

98,41% 

98 , 76% 


Tableau 4 : Taux de reconnaissance sur BD1 

Ces resultats montrent un taux d’erreur de 1,24% avec un modele de topologie de 5 
etats. Nous estimons que les erreurs de reconnaissance sont attributes, d’une part, 
aux methodes utilisees pour la pre-classification et a la detection des points 
d’interets et, d’ autre part, a l’insuffisance des caracteristiques utilisees pour mieux 
decrire chaque segment. En outre, cette faible erreur provient aussi de la 
deformation de certains caracteres dans certaines fontes, notamment dans les fonts 
« Tassafut » et « Taromeit ». Nous constatons que le nombre de gaussiennes 
utilisees n’ influence pas les resultats alors que son augmentation implique un 
nombre important de parametres a calculer. Cependant, le choix de la topologie 
influence directement les resultats. Par consequent, P augmentation de nombre 
d’etats augmente le taux de reconnaissance de systeme. 

4.2. Approches syntaxiques 

Dans (Essaady et al., 2010), nous avons presente un systeme automatique de 
reconnaissance de caracteres amazighs imprimes, base sur une approche syntaxique 
utilisant les automates finis. Apres des pretraitements sur l’image du caractere, des 
algorithmes appropries sur le squelette de caractere permettent de construire la 
chaine representative du caractere a partir du codage de Freeman. La chaine 
reconstruite est utilisee a l’entree d’un automate fini qui reconnait les caracters 
amazighes. Cet automate global a ete construit a partir des automates de 
reconnaissance specifique a chaque caractere amazigh. Nous avons teste notre 
application sur une base de caracteres amazighes imprimes que nous avons creee. 
Nous avons obtenu des resultats encourageants. En effet, sur les 630 caracteres lus, 
589 ont ete reconnus, soit un taux de reconnaissance de 93,49%. Le Tableau 5 ci- 
dessous presente les taux des mauvaises affectations et mauvais rejets. Ces erreurs 
proviennent de la forme de certains caracteres non reconnus, dont le squelette 
comporte plus de segments non orthogonaux. En effet, la methode de 
reconnaissance est basee sur une vectorisation du squelette du caractere a 
reconnaitre. Done, une erreur de vectorisation va forcement entrainer une erreur 
dans la description du caractere. En fait, le principal inconvenient de cette methode 
est la sensibilite du squelette au bruit. 
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Taux d’ affectations a tort 

2,28 % 

Taux de rejets a tort 

4,23 % 


Tableau 5 : Pourcentages des erreurs de reconnaissance 

4.3. Approches neuronales 

El Ayachi et cd. (2010) proposent un systeme de reconnaissance de l’ecriture 
tifinagh base sur les reseaux de neurones multi couches avec les memes 
caracteristiques utilisees precedemment. Les resultats trouves avec un reseau de 
neurones d’une seule couche cachee sont meilleurs que ceux obtenus avec la 
programmation dynamique. De plus, le taux de reconnaissance obtenu en utilisant 
une seule couche cachee est plus eleve que celui obtenu avec deux ou trois couches 
cachees. 

Dans (Essaady et al., 2011b), et pour ameliorer les resultats du precedent systeme 
et d’ avoir un systeme complet qui reconnait la totalite des caracteres amazighs 
imprimes et manuscrits, nous avons presente un systeme de reconnaissance 
automatique du texte amazigh, base sur les reseaux de neurones multicouches. 
L’approche proposee a recours a des primitives statistiques en se basant sur la 
position des lignes centrales du caractere et les techniques de fenetres glissantes. 

Dans ce systeme et dans un premier temps, nous avons utilise la ligne centrale 
horizontale du caractere pour extraire un ensemble de caracteristiques de densite 
basees sur cette ligne. Dans un second temps, nous avons propose une amelioration 
de ce systeme de reconnaissance en ajoutant d’autres caracteristiques de densite 
basees sur la ligne centrale verticale du caractere afin d’ exploiter la similarite de 
plusieurs caracteres amazighs par rapport a la ligne centrale verticale du caractere. 
Les differentes variantes ont ete testees et evaluees sur deux bases : la base des 
patterns de la graphie amazighe (Ait ougangay, 2009) et la base AMHCD des 
caracteres amazighs manuscrits (Essaady et al., 2011a). En effet, nous avons 
montre les resultats de reconnaissance obtenus en fonction de 1’ integration des 
caracteristiques dependantes et independantes a la ligne centrale horizontale du 
caractere. Enfin, nous avons presente les resultats obtenus par la version amelioree 
et leur comparaison avec ceux obtenus par la premiere variante du systeme. 

Nous avons aussi utilise des techniques de validation croisee pour 1' evaluation des 
resultats de reconnaissance. La validation croisee est une methode d' estimation de 
la fiabilite des resultats, fondee sur une technique d'echantillonnage R. (1995). 

Le Tableau 6, ci-dessous, presente les resultats du systeme propose en utilisant la 
validation croisee 10 fois sur la base des patterns de la graphie amazighe et sur la 
base de caracteres manuscrits. 
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Les caracteristiques 
integrees 

Base des patterns de 
la graphie amazighe 

Base de caracteres 
amazighs 
manuscrits 

Taille de 
la base 

Taux de 
Re con 

Taille de 
la base 

Taux de 
Recoil 

Caracteristiques 
independantes de la ligne 
centrale 

19437 

caracteres 

88.68 % 

20150 

caracteres 

84.49 % 

Caracteristiques 
dependantes et 
independantes de la ligne 
centrale horizontale 

19437 

caracteres 

98.49 % 

20150 

caracteres 

92.23 % 

Caracteristiques 
dependantes et 
independantes de la ligne 
centrale horizontale et 
verticale 

19437 

caracteres 

99.28 % 

20150 

caracteres 

96.32 % 


Tableau 6 : Resultcits de reconnaissance du systeme ameliore enfonction des 
caracteristiques integrees en utilisant la validation croisee lOfois 

Pour la base des patterns de la graphie amazighe, le taux de reconnaissance est 
88,68% lors de l’utisation seulement des caracteristiques independantes de la ligne 
centrale horizontale et augmente a 98,49% lors de l'ajout des caracteristiques 
basees sur la position de la ligne centrale horizontale. Ce dernier taux s’eleve aussi 
a 99,28% lors de l'ajout des caracteristiques basees sur la position de la ligne 
centrale verticale. 

Pour la base de caracteres amazighs manuscrits, le taux augmente de 84.49% a 
92,23% lors de l'ajout des caracteristiques basees sur la position de la ligne centrale 
horizontale et monte a 96,32% lors de l'ajout des caracteristiques basees sur la 
position de la ligne centrale verticale. 

Les erreurs sont principalement dues a une grande similarite morphologique entre 
certains caracteres amazighs et, parfois, sur des fontes differentes. 

En comparant les differents taux de reconnaissance obtenus par le systeme en 
fonction de caracteristiques integrees, nous constatons une amelioration due a 
l'integration des caracteristiques basees sur la position des deux lignes centrales 
(verticale et horizontale). Cela confirme que ces caracteristiques offrent une 
amelioration significative a la performance de reconnaissance. 
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5. Synthese comparative 


Le Tableau 7 recapitule les principales caracteristiques, les techniques et les 
resultats obtenus par des approches et les systemes de reconnaissance de l’ecriture 
amazighe que nous avons proposes. 


Auteurs 

Primitives 

Modelisation 

Resultats 

(Amrouch et 
al., 2010, 

2012a) 

- primitives 
directionnelles 
(Transformee de 

Hough) 

- HMM continu et 
discret 14 -etats 

- topologies de type 
gauche droit. 

- apprentissage le 

critere (MLE) 

- Classification 
FORWARD 

- 90.4 % en cas 
discret. 

- 97, 89% en cas 
continu. 

- Base (AMHCD). 

- Base 

d’ apprentissage 
(2/3). 

- Base de test (1/3). 

(Amrouch et 
al., 2012b, 
2012c) 

- primitives 
structurelles 
(diametre, 

excentricite, etendue, 
Centre de masse, 
orientation, longueur 
d’axe minimal et 
principal, moment 

d’ordre 1 et 2) 

- HMM continu. 

- topologies de type 

lineaire et 

ergodique 

- Apprentissage 
Baum-welsh 

- Classification 
Viterbi 

- 98 ,76% 
la base de donnees 
de patterns de la 
graphie amazighe. 
Base 

d’ apprentissage 
(2/3) 

Base de test (1/3) 

(Essaady et 
al., 2010) 

- Codage de Freeman 
(suivi de squelette) 

- reseaux des 

automates. 

- (Grammaire 
formelle) 

- 93,49% 

- selon les donnees 
utilisees. 

(Essaady et 
al., 201 lc) 

- primitives statistiques 

- caracteristiques 

dependantes et 

independantes de la 
ligne centrale 

horizontale et verticale 

- fenetres glissantes 

horizontales et 

verticales 

- Reseaux de 

neurones 
multicouches. 

- couche d’ entree 95 
neurones 

- couche de sortie 31 
neurones 

- couche cache (nb 
d’ entrees + nb de 
sorties)/2 

- 99.28 % 

Base des patterns de 
la graphie amazighe 
(19437 caracteres) 

- 96.32 % 

Base AMHCD 
(20150 caracteres) 
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- Apprentissage de 
Heb (q=0,2, 

taux=0,3, 
itera=1000) 


(Elaychi et 
al., 2010) 

- les moments 

invariants et la 

transformee de Walsh 
utilisant la 

progr animation 
dynamique. 

- La programmation 
dynamique 

- Taux de 
reconnaissance tres 
interessant 

(Elaychi et 
al., 2011) 

- un reseau de neurones 
multi couches avec les 
memes 

caracteristiques 

utilisees 

precedemment. 

- Programmation 
dynamique 

- Resultats tres 
interessants 

(Elaychi et 
al., 2011b) 

- Les caracteristiques 
geometriques : les 

projections 

horizontales et 

verticales, les centres 
de gravite en x et en y, 
le perimetre, l’aire, la 
compacite et les 
moments centraux 

d'ordre 2. 

- reseau de neurones 
artificiels (RNA) 

- Resultats tres 
interessants 

(Djematen et 
al., 1998) 

- les extremites, les 
points, les sommets 
(points de changements 
de direction) et les 
nceuds a 3 et 4 
branches. 

- methode 

statistique : mesurer 
les degres de 

vraisemblance 

- Resultats plus ou 
mois interessants 


Tableau 7 : syn these des approches et systemes proposes 

Apres avoir etudie et compare les differentes approches, nous constatons que la 
meilleure et la performante approche, quant au temps de calcul, espace memoire et 
taux de reconnaissance, est 1’ approche basee sur les primitives statistiques et les 
fenetres glissantes dans la phase de pretraitement et les reseaux de neurones dans la 
phase de classification (Essaady et al., 201 lc). 
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6. Conclusion et perspectives 

Nous avons presente dans ce papier des travaux traitant la reconnaissance 
automatique des caracteres amazighs. L’objectif est de faire une synthese des 
travaux effectues sur ce sujet. Ces approches presentent un certain nombre de 
limites qui proviennent a la fois du module de pretraitement et des caracteristiques 
prises dans la phase d’apprentissage. En plus, les bases de caracteres utilisees dans 
les tests restent parfois faibles et parfois non standards. Par consequent, des travaux 
de recherche futurs doivent apporter des ameliorations, d’un cote, sur ces 
approches et, d’un autre cote, developper d’autres systemes qui repondent aux 
attentes. Et parmi nos travaux futurs, nous allons proposer des systemes hybrides 
qui utilisent des primitives de nature differente en combinant ces approches dans le 
processus de traitement. Ce qui permettra de profiter a priori des avantages de 
chacune des approches tout en evitant les principaux inconvenients. 
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